Rank in Wordlist | Frequency | Word |
---|---|---|
2388 | 831 | 2- |
2432 | 815 | 1- |
2780 | 698 | 3- |
3611 | 509 | 4- |
4585 | 382 | 5- |
4987 | 343 | ۲- |
5113 | 332 | ۱- |
5346 | 312 | 6- |
5770 | 284 | ۳- |
6439 | 243 | 7- |
7213 | 210 | ۴- |
7390 | 202 | 8- |
8284 | 171 | 9- |
8655 | 161 | ۵- |
9926 | 132 | 10- |
10609 | 121 | ۶- |
11855 | 102 | 11- |
13980 | 80 | 12- |
14475 | 76 | 2-3 |
14879 | 73 | 13- |
Rank in Wordlist | Frequency | Word |
---|---|---|
73321 | 6 | 1-2-3 |
112722 | 3 | 1-91-90 |
112989 | 3 | 33-23-39 |
113222 | 3 | Arkani-Dvali-Dimopoulos |
125443 | 3 | دی-وی-دی |
127048 | 3 | س-پ-اه |
127049 | 3 | س-ک-س |
144097 | 2 | 15-3-5-2، |
144320 | 2 | 2-1- |
144321 | 2 | 2-5- |
Rank in Wordlist | Frequency | Word |
---|---|---|
144097 | 2 | 15-3-5-2، |
150350 | 2 | آفرین---- |
152769 | 2 | است--- |
174081 | 2 | دو---لت |
184055 | 2 | طبرستان(گیلک-تالشی-دیلمی-طبری-آمارد-کاسپین)ایجاد |
192429 | 2 | مزاحم(م---ن)تو |
207143 | 2 | وهاب-کاوه-هیوا-صبا-مریم-پوریا-علی-ساغر-چراغی |
211616 | 2 | ک-ن-ک-و-ر |
213756 | 2 | کوتاه-بلند-کوتاه-بلند-بلند |
215208 | 2 | گفتم--- |
Rank in Wordlist | Frequency | Word |
---|---|---|
150350 | 2 | آفرین---- |
184055 | 2 | طبرستان(گیلک-تالشی-دیلمی-طبری-آمارد-کاسپین)ایجاد |
207143 | 2 | وهاب-کاوه-هیوا-صبا-مریم-پوریا-علی-ساغر-چراغی |
211616 | 2 | ک-ن-ک-و-ر |
213756 | 2 | کوتاه-بلند-کوتاه-بلند-بلند |
220811 | 1 | 1:زنجان-مرکزی-گلستان-چهارمحال-کرمانشاه-سیستان |
226503 | 1 | A-B-S-C-D |
226732 | 1 | Airborne-Troops-PC-Game-www |
231391 | 1 | Pro-Evolution-Soccer-2012-PES-2012-PC-Game-www |
247860 | 1 | آخر-دا-تفحص-ارميا-خودت |
Some languages allow the formation of longer word by composition using hyphens. Moreover, proper names may contain hyphens. Therefore we look for the most frequent words containing 1, 2, 3 or 4 hyphens.
Usually we find interesting words. But in the case of poor preprocessing there may be unexpected strings resulting from hyphenation etc. Words ending with an hyphen are usually not welcome, too.
For three hyphens:
select w_id-100,freq, word from words where word like "%-%-%-%" limit 10;
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots
3.12.4 Words containing special characters